home *** CD-ROM | disk | FTP | other *** search
/ ftp.cs.arizona.edu / ftp.cs.arizona.edu.tar / ftp.cs.arizona.edu / tsql / doc / benchmark.mail / 000001_Elias.Eliopoul…n.ariadne-t.gr _Tue Jun 29 17:19:00 1993.msg < prev    next >
Internet Message Format  |  1996-01-31  |  11KB

  1. Received: from ARTS01.INFN.IT (cosine-gw.infn.it) by optima.CS.Arizona.EDU (5.65c/15) via SMTP
  2.     id AA04078; Tue, 29 Jun 1993 08:20:08 MST
  3. Received: From MR(RFCGATEWAY) by MAILER with Id HERMHS      0023081.000741365864
  4.           for MAILER@ARTS01.INFN.IT; Tue, 29 JUN 93 17:19 GMT
  5. Message-Id: <HERMHS      0023081.000741365864>
  6. X-Posting-Date: 29-JUN-1993 14:57:44.00
  7. Received: via INFNGW
  8. Date:  Tue, 29 JUN 93 17:19 GMT
  9. From: Elias.Eliopoulos@isosun.ariadne-t.gr
  10. Subject:  
  11. To: tdbbenchmark@cs.arizona.edu
  12. X-Original-To: tdbbenchmark@cs.arizona.edu
  13.  
  14. RFC-822-Headers:
  15. Received: by isosun.ariadne-t.gr (4.1/SMI-4.0-MHS-6.0)
  16.     id AA23077; Tue, 29 Jun 93 17:57:42 +0300
  17.  
  18.  
  19. Dear Rick and Christian,
  20. With respect to the paper on a benchmark on temporal datand Christian,#M#JWith respect to the paper on a benchmark on temporal datshould write something like the following: 'Given that there are many diverse data modelling approaches in the area, each co-
  21. author has tried to identify reasonable queries whose formulation and also their answering should be enabled by a valid time DBMS. This will allow the reader identify from this set of queries those which, in his opinion, are most important and thus perfor
  22. m a personal evaluation of each model, based on two parameters, firstly whether each query can be formulated in some model and, secondly, how easily it can be formulated.'
  23.  
  24. Secondly, if the 'benchmark' is to appear as a joint paper, we wonder whether it would be wise for every author to express his personal ideas at the end of the paper. In spite of this, our own comments are the following:
  25.  
  26. Comments on the paper
  27. 1. It is unavoidable that the queries and also the schema of the database have been influenced by individual models. For example, in an ungrouped model, the schema could perhaps be completely different, if we were to record the history of employee names.
  28.  
  29. 2. The key and the functional dependencies between various pieces of data are given in the paper. This directly implies that we all agree in 'what the key of a historical relation is', which is not true. We think that we should rather write that 'we provi
  30. de the functional dependencies which we assume that the data satisfy at each time instant'.
  31.  
  32. 3. Many queries (eg 2.1.1, 2.1.2, 2.1.7, 2.1.5) imply that certain scalar and perhaps aggregate functions are supported but we do not specify which they are. In contrast, we are quite specific on the relational operators which are supported.
  33.  
  34.  
  35. Minor improvements
  36. Q2.1.5 should be modified as: 'whose salary remained the same for the longer continuous time' or something like this.
  37.  
  38. Q2.1.7 does not seem to be a reasonable query, in the general case in which there are many managers.
  39.  
  40. Q2.2.4 should be rephrased as 'For all departments whose managers and budgets have not changed for the last 18 months ...'.
  41.  
  42. Q2.3.5 is practically identical to Q2.1.5, if we take into consideration the fact that a salary only increases. The distinction will be clearer if in Q2.3.5 we consider a case in which an employee ceases being paid and, after some time he starts being pai
  43. d again with the same salary.
  44.  
  45. Q2.3.10: Rather than write 'in a department called Toy', better to write 'in the Toy department'. The same remark applies to some other queries.
  46.  
  47. Q2.4.3 is similar to Q2.4.7. In Q2.4.3 it is better to explicitly write 'at least 5 consecutive years'.
  48.  
  49. Q4.2.3: Write: 'exceeded', 'continued'.
  50.  
  51. Q4.2.4: replace 'at' by 'one'. Do you mean exactly one year? 
  52.  
  53. Q4.4.3: Omit the second 'they'.
  54.  
  55. Q4.10.5: omit 'then'.
  56.  
  57.  
  58.  
  59. New classes of queries
  60. There are many reasonable queries for which no provision has been made in the taxonomy. We distinguish them into groups A, B and C below.
  61.  
  62. Group A: To simplify the discussion, in the following we do not distinguish between event, interval and element. In addition, we do not distinguish between value, derived and imposed. Instead, we only consider the case that a piece of data d1 is valid at 
  63. time t1 and, similarly, d2 is valid at t2. Then the output-based taxonomy may require the output of the following results:
  64.  
  65. 1. t1        t2     
  66. 2. t1             d2
  67. 3. t1        t2   d2
  68. 4.      d1   t2     
  69. 5.      d1        d2
  70. 6.      d1   t2   d2
  71. 7. t1   d1   t2   d2
  72.  
  73. Relevant Examples
  74. 1. Give the time Edward was in the Toy department and the time his salary became $30K (output of the form t1, t2).
  75. Answer: "2/1/82 - 1/31/87, 6/1/82"
  76.  
  77. 2. Give the time Edward was in the Toy department and the department he is currently working in (output of the form t1, d2).
  78. Answer: "2/1/82 - 1/31/87, Book"
  79.  
  80. 3. Give the time Edward was in the Toy department and his salary history (output of the form t1, t2, d2).
  81. Answer: "2/1/82 - 1/31/87, ((2/1/82 - 5/31/82, $20K), (6/1/82 - 1/31/85, $30K), (2/1/85 - 1/31/87, $40K), (4/1/87 - present, $40K))"
  82.  
  83. Similarly, for the remainder cases:
  84.  
  85. 4. Give the department in which Edward was at time 12/31/84 and the time at which his salary became greater than $20K.
  86. Answer: "Toy, 6/1/82"
  87.  
  88. 5. Give Di's salary at time 12/31/85 and 12/31/86.
  89. Answer: "$40K, $50K"
  90.  
  91. 5. Give Di's salary at time 12/31/85 and the department she was in at time 12/31/86. (Note that in this query the time must also be output so as to associate each salary with the respective date).
  92. Answer: "12/31/85, $40K, 12/31/86, Toy"
  93.  
  94. 6. Give Di's salary at time 12/31/85 and her salary history.
  95. Answer: "$40K, ((1/1/82 - 7/31/84, $30K), (8/1/84 - 8/31/86, $40K), (9/1/86 - present, $50K))"
  96.  
  97. 7. Give Di's salary at all times less than 12/31/85 and her department history at all times greater than 12/31/86.
  98. Answer: "((1/1/82 - 7/31/84, $30K), (8/1/84 - 12/31/85, $40K)), Toy, 12/31/86 - present"
  99.  
  100. Using the above classification of queries, we can see that there are 7 distinct classes of the output-based taxonomy.
  101.  
  102. Similarly, the top-level selection-based taxonomy might be classified into 7 classes (if reasonable queries can be identified) and this could result in 49 distinct types of queries. If we further consider in conjunction all the cases you have already iden
  103. tified, then it is likely that the number of classes will be further increased
  104.  
  105.  
  106. Group B: Queries which require unnestings and nestings (It applies only to grouped models). Some queries are the following.
  107.  
  108. 1. For each department give the current names of the employees who ever worked in it.
  109. Answer: "Toy, ((Edward), (Di))", 
  110. "Book, Edward"
  111.  
  112. 2. For each department give the current names of the employees who worked in it and also the respective time.
  113. Answer: "Toy, ((Edward, 2/1/82 - 1/31/87), (Di, 1/1/82, present))", 
  114. "Book, Edward, 4/1/87 - present"
  115.  
  116. 3. For every department give the current names of the employees who worked in it and for each of the employees give his salary history.
  117. Answer: "Toy, ((Edward, (($20K, 2/1/82 - 5/31/82), ($30K, 6/1/82 - 1/31/85), ($40K, 2/1/85 - 1/31/87))), (Di, (($30K, 1/1/82 - 7/31/84), ($40K, 8/1/84 - 8/31/86), ($50K, 9/1/86 - present))))", 
  118. "Book, Edward, $40K, 4/1/87 - 12/31/88"
  119.  
  120. 4. For each department give the distinct salaries whose employees were earning at time 12/31/84. 
  121. Answer: "Toy, (($30K), ($40K))", 
  122. "Books, -"
  123.  
  124. 5. For each particular salary value, list the current names of the employees who were getting this salary.
  125. Answer: "$20K, Edward", 
  126. "$30K, ((Edward), (Di))", 
  127. "$40K, ((Edward), (Di))", 
  128. "$50K, Di"
  129.  
  130. 6. For each particular salary value list the current names of the employees who were getting this salary and also the respective times.
  131. Answer: "$20K, Edward, 2/1/82 - 5/31/82", 
  132. "$30K, ((Edward, 6/1/82 - 1/31/85), (Di, 1/1/82 - 7/31/84))",
  133. "$40K, ((Edward, ((2/1/85 - 1/31/87), (4/1/87 - present)), (Di, 8/1/84 - 8/31/86))", 
  134. "$50K, Di, 9/1/86 - present"
  135.  
  136. 7. For each time instant within 5/30/82 - 6/2/82, give the distinct salaries which the employees were earning.
  137. Answer: "5/30/82, (($20K), ($30K))", 
  138. "5/31/82, (($20K), ($30K))", 
  139. "6/1/82, $30K", 
  140. "6/2/82, $30K"
  141.  
  142. 8. For every manager give the departments in which he worked and the relevant time.
  143. Answer: "Di, ((Toy, ((1/1/82 - present))))"
  144.  
  145. 9. For every department give his managers and the relevant time.
  146. Answer: "Toy, ((Di, ((1/1/82 - present))))", 
  147. "Book, -, -"
  148.  
  149. Note that this result is different than that of the previous query. In particular a grouped model must be capable of grouping the result of each query in a distinct way as is shown by the pairs of brackets.
  150.  
  151. 10. For every manager list the current names of his employees and the time at which each of them was managed by this particular manager.
  152. Answer: "Di, ((Edward, 2/1/82 - 1/31/87))"
  153.  
  154. 11. For each employee (current name) give his managers and the time at which he was managed by each of them.
  155. Answer: "Edward, ((Di, 2/1/82 - 1/31/87))", 
  156.  
  157. Note that this result is different than that of the previous query. In particular a grouped model must be capable of grouping the result of each query in a distinct way as is shown by the pairs of brackets.
  158.  
  159. 12. List the salary and department of each employee (current name) at times 12/31/84 and 12/31/85 (Here, we want to retrieve data at two distinct time points. Clearly, there is no need to have a nested relation.)
  160. Answer: "12/31/84, Edward, Toy, $30K", 
  161. "12/31/84, Di, Toy, $40K", 
  162. "12/31/85, Edward, Toy, $40K", 
  163. "12/31/85, Di, Toy, $40K"
  164.  
  165. Clearly, queries like the above can also be classified in a systematic way.
  166.  
  167. Group C: It includes various queries which we do classify into some particular class.
  168.  
  169. 1. For each employee (current name) list his salary on date 12/31/84, 12/31/85, and 12/31/86.
  170. In this query we want to retrieve employee salaries at more than one specific time instant. It is obvious therefore that the resulting relation must contain for each employee his name and three salaries, each of them recorded next to one of the dates 12/3
  171. 1/84, 12/31/85, and 12/31/86.
  172. Answer: "Edward, ((12/31/84, $30K), (12/31/85, $40K), (12/31/86, $40K))", 
  173. "Di, ((12/31/84, $40K), (12/31/85, $40K), (12/31/86, $50K))"
  174.  
  175. 2. Let us assume that a department is operational if at least one employee works in it. Then a query can be:
  176. For each department, list the time at which it was operational.
  177. Answer: "Toy, 1/1/82 - present", 
  178. "Book, 4/1/87 - present"
  179.  
  180. 3. For each employee (current name) show his salary and assignment to departments for each of the dates from 5/30/82 to 6/2/82
  181. Answer: "Edward, 5/30/82, $20K, Toy", 
  182. "Edward, 5/31/82, $20K, Toy", 
  183. "Edward, 6/1/82, $30K, Toy", 
  184. "Edward, 6/2/82, $30K, Toy", 
  185. "Di, 5/30/82, $30K, Toy", 
  186. "Di, 5/31/82, $30K, Toy", 
  187. "Di, 6/1/82, $30K, Toy", 
  188. "Di, 6/2/82, $30K, Toy".
  189.  
  190. 4. For each employee (current name) list the greater time intervals at which there is no change either at his salary or at the department he works in.
  191. Answer: "Edward, 2/1/82 - 5/31/82, $20K, Toy", 
  192. "Edward, 6/1/82 - 1/31/85, $30K, Toy", 
  193. "Edward, 2/1/85 - 1/31/87, $40K, Toy", 
  194. "Edward, 4/1/87 - present, $40K, Book", 
  195. "Di, 1/1/82 - 7/31/84, 30K, Toy", 
  196. "Di, 8/1/84 - 8/31/86, $40K, Toy", 
  197. "Di, 9/1/86 - present, $50K, Toy"
  198.  
  199.